混合属性相关论文
针对混合属性离群点检测问题,提出基于邻域近似精度的混合属性离群点检测方法。首先,定义异构邻域关系度量来表示混合数据之间的近邻......
针对粗糙集方法不能有效处理数值和混合型数据的问题,本文以邻域粗糙集中粒计算为基础,提出了一种基于邻域粒的离群点检测方法.首......
聚类算法是一种广泛应用于数据挖掘、机器学习、图像处理等若干领域的重要技术。进化聚类算法是聚类算法中的重要分支,本文旨在提......
聚类分析是数据挖掘和机器学习领域中的研究热点之一,其目的是根据物理或者抽象对象间的相似性将数据对象划分成不同的类别,使同一个......
聚类分析是数据挖掘研究中的热点,但是传统的方法大多数只适用于静态且单一属性类型的数据聚类。随着网络的迅速发展,对实时产生的流......
近年来,越来越多的应用产生数据流,它是连续的、有序的、快速变化的、海量的数据。流数据不同于传统的存储在磁盘上的静态的数据,......
数据聚类是数据挖掘中的一个重要分支,目前已有的数据聚类算法大部分局限于处理只具有连续属性的数据,另外有少量的算法局限于处理......
聚类分析是数据挖掘中一个重要的研究分支,已在多个领域得到了很好的应用,诸如模式识别,数据分析和图像处理等。随着实际应用中数据的......
在电子商务推荐系统、社交网络分析、生物医药等领域普遍存在重叠聚类问题。每天都在海量增加的增数据使得数据间的关系变得更复杂......
聚类是一种无训练集和无训练过程的机器学习方法。聚类分析广泛应用于各个领域,例如:生物工程,商业引流,金融投资,医学影像研究,用......
在数据挖掘的过程中,经常出现缺失数据的现象,这可能导致数据分析算法无法建立可靠的模型,从而得不到准确的分析结果,由此出现了许......
学位
2018年上海市政府公布了《关于促进和加强本市3岁以下幼儿托育服务工作的指导意见》,要求通过政府引导、家庭为主、多方参与,建立......
数据挖掘是应用数学的一个热门研究领域。近年来,随着计算机技术、通信技术以及网络技术的飞速发展,许多领域中出现了连续到达、持......
数据聚类是数据挖掘中的重要研究内容.现实世界中的数据往往同时具有连续属性和离散属性,但现有大多数算法局限于仅处理其中一种属......
基于距离和基于密度的离群点检测算法受到维度和数据量伸缩性的挑战,而空间数据的自相关性和异质性决定了以属性相互独立和分类属性......
数据流的聚类是数据流挖掘的一个重要问题.提出一种针对混合属性的数据流聚类算法,它采用相异度来代替普通的聚类距离,并将等价相......
针对越来越多的应用领域要求数据流聚类算法能处理同时包含数值属性特征与分类属性特征的数据,同时由于在已有的流数据聚类算法中,......
行政裁决作为一种决定型ADR,在争议解决上有自身优势,将再一次受到国家重视,以满足多元化纠纷解决机制的需求。随着PPP模式的大力......
针对混合属性数据聚类难度高的问题,提出一种基于广义线性模型的混合属性数据聚类方法。首先,构建低阶多元广义线性模型处理海量数......
为妥善分割处于混合状态的大数据信息参量,实现对结构化信息主体的分类存储,设计混合属性大数据的分类存储系统。按照NetLinx架构......
指挥信息系统或战争模拟系统设计中,战场态势系统容易出现军标重叠的显示问题,干扰指挥员对态势信息的正确判读。针对上述问题,提......
针对分类研究中采用单一类型数据造成的结果失真,提出了综合考虑产品属性和销售时间序列的两阶段优化聚类算法。分别采用基于属性......
为解决混合属性中数值属性与分类属性相似性度量的差异造成的聚类效果不佳问题,分析混合属性聚类相似性度量的问题,提出基于熵的混......
聚类分析是一种有效的异常入侵检测方法,可用以在网络数据集中区分正常流量和异常流量。文中采用模糊C-均值聚类算法对网络流量样本......
针对目前入侵检测系统应用时处理类别型数据能力欠缺、误报率高的问题,提出一种改进的无监督异常检测算法。该算法基于k-原型聚类思......
人工神经网络应用中最大的弊端是缺乏可理解性,而对结果的解释是任何一个完善的智能系统必备的基本特征。从神经网络中提取规则被公......
数据流离群检测因内存容量限制和实时检测需求而成为离群检测的一个难点。介绍了一种快速混合属性数据流离群检测算法。在衰减模型......
摘要:现有的流数据聚类算法往往只能处理单一属性类型的流数据,或是不能发现任意形状的聚类。针对这个问题,该文提出一种混合属性......
借助于近似极大值函数的凝聚函数,将传统数据聚类问题转化为无约束优化问题求解.首先利用一阶必要条件,推导出数值属性下数据聚共中心......
对于混合属性相关度的计算,现有方法的做法是将连续属性离散化后,用基于频率的计算方法来计算。而连续属性离散化可能会丢失部分信息......
聚类是数据挖掘中一个非常活跃的研究分支,任意形状的聚类则是一个有待研究的开放问题。提出一种包含分类属性取值频率信息的类间差......
K-prototypes算法只适合处理对称标称型数据、序数型数据和区间型数据,对于用户兴趣等非对称型数据之间的相异度计算,如果采用对称......
针对混合属性空间中具有同一(或相近)分布特性的带类别标记的小样本集和无类别标记的大样本数据集,提出了一种基于MST的自适应优化相......
以KDDCUP99-10%网络入侵数据集作为数据流,提出一种混合属性数据流的两阶段入侵检测算法.通过增量聚类提取数据流的代表信息,根据......
k-Prototypes算法对初始点选取的敏感性导致聚类结果具有随机性,并且忽视样本数据点与聚类集合中已有样本的总体差异.针对此问题,文中......
在分析现有混合属性数据聚类算法存在问题的基础上,选用基于图论的松弛聚类算法作为解决问题的“基石”;引入基于“Local Scale”思......
文中提出一种离散和连续混合属性的复杂信息系统增量式属性约简算法.首先,将粒计算模型中的知识粒度在混合型信息系统下进行推广,......
对于一些局部分布稀疏不均、聚类区域的形状及大小很不规整的数据点集,多数聚类算法不能很好地探测出其聚类分布。在借鉴了两个加......
针对实数型、区间型、三角模糊数和不确定性语言组成的混合多属性决策问题,首先分析了混合属性信息的度量关系,并结合混合属性特点......
传统聚类方法将对象严格地划分到某一类,但是很多时候边界对象不能被严格地划分。基于粗糙集的k-means聚类算法和基于粗糙集的lead......
混合属性聚类是近年来的研究热点,对于混合属性数据的聚类算法要求处理好数值属性以及分类属性,而现存许多算法没有很好得平衡两种......
在传统的免疫异常检测算法中,通常存在检测器对非我空间的覆盖漏洞,以及检测器数量过大且相互覆盖等问题,这是导致免疫异常检测算......
聚类是数据挖掘中的主要方法 .讨论了在大多数聚类算法中的相似性测量方法 ,并以属性的类型作为选择相似性的标准 ,阐述了用于数值......
针对当前多级模糊模式识别方法依赖检测时间,对水质进行评价结果不够全面的问题,提出一种基于混合属性的多级模糊模式识别的方法对水......
数据的爆炸式增长为数据挖掘技术的应用带来了契机,聚类分析是数据挖掘领域中极为活跃的研究方向之一,旨在分析数据的分布、研究数......
现有聚类融合算法对混合属性数据进行处理的效果不佳,主要是融合后的结果仍存在一定的分散性。为解决这个问题,提出了一种基于图论......
现有的数据流聚类算法无法处理高维混合属性的数据流。针对该问题,对HPStream算法的脱机聚类和联机聚类过程进行改进,利用频度矩阵......